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Целью настоящей работы является создание и 


обучение искусственной нейронной сети на 
основе набора данных, содержащих различ- 
ные климатические параметры и будущую 
площадь пожара в качестве выходного про- 
гнозируемого параметра. Такой набор данных 
является, как правило, доступным для иссле- 
дования и изучения. Перед обучением модели 
нейронной сети набор данных разделяют на 
две выборки — выборка для обучения, кото- 
рая составляет около 90 % от набора, и выбор- 
ка для тестирования обученной модели. В по- 
становке задачи авторы выбирают и анализи- 
руют известные данные о пожарах в парке 
Монтезиньо (Мошезтйо), сравнивают модели, 
обученные на этих данных с нормализацией и 
без нее. В качестве результата приведены два 
примера графиков изменения абсолютной 
ошибки площадей пожара, прогнозируемых с 
помощью созданной и обученной модели. 
Ключевые слова: площадь горения, машин- 
ное обучение, модель, нейронные сети, Кегау, 
прогнозирование, лесной пожар. 


ООС 004.853 
6 ръ://401.0г2/10.23947/2541-9129-2019-3-17-22 


КОВЕСАЗТИХС ГОВЕЗТ ЕТВЕ ВОВММС 
АВЕА ОМС МАСШУ\Е ТВКАГМ\С 


ЕШррепКГо У. А., Гоюу А. У. 
Роп $ ае Тесбиса! Ошуегзку, Козюу-оп-Ооп, 
Киззлап Недегайоп 


рыШррепКо @ шБох.га, 
а70(70(@ ста!.сот 
'ТБе обесиуе о 1$ агасе 1$ © стеже апа гаш 


ап агайсла! пеига! пебуотКк Базе оп а ааа зе 
сошаште уатои$ сШтайс рагатает$ апа Гааге 
Пге агеа аз ап оириё рагатёег фас Фе аи®ог$ 
и\епа 0 ргеД1сЕ. ЗасЬ а “зе” о ама 1$ изааПу 
ауа|ае Гог гезеагсй ап заду. ВеГоге шатшите 
{фе пеига! пебхотКк поде]1, Фе даа $е{ 1$ Чу1аеа 
шо го затр[ез: а затре Гог Наше, \УысьЬ 1$ 
абои( 90% от Фе $е1; ап а затр/е Гог (езипх Ше 
(таше то4е]. ш зепе Фе (азК, Ше аифог$ $е- 
[ес( ап апа!уте Фе Кпоууп даа оп Фе Пгез Фа 
оссите4 ш МощезшвВо РагК, сотраге фе тод- 
е15 гашей оп Фезе даа уф апа \зифоиЕ погта|- 
17ааоп. Аз а теза, мо ехатр]е$ аге слуеп оГа 
фаашайуе детопзгайоп оЁ этарб$ ог абзойке 
етгог свапоез$ оГ Йге агеаз, \у№сВ аге рго]есцед 


и$т2 фе сгеже4 ап4 гате тодЕе]. 


Кеу\могд5$: Бигишо агеа, тасбше гашиле, тод- 
е1, пеига! пебуогк$, Кегау, Тогесазип®, Тогез 
Пге. 


Введение. Лесным пожаром называют стихийное и неуправляемое распространение огня 


по лесным площадям. Согласно данным Федерального агентства лесного хозяйства за неделю с 3 


по 9 июня 2019 года в 45 регионах России лесопожарные силы и привлеченные лица ликвидиро- 


вали 354 лесных пожара на площади 5783,2 га, в том числе за выходные дни 8-9 июня потушено 


98 пожаров на площади 1790,05 га. Из-за дыма при возгораниях ежегодно умирают около 300 ты- 


сяч человек. В результате сгорании биомассы образуется аэрозольно-газовая смесь, представляю- 


щая эколого-токсикологический риск для человека. 


Сотрудники пожарной охраны должны быть обеспечены максимально эффективным по- 


Жжарно-техническим снаряжением и техникой для ликвидации стихийных явлений. Но часто этого 


недостаточно для эффективной борьбы с таким опасным явлением. Стратегическое планирование 
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и распределение ресурсов, например предоставление достаточного количества пожарных самолеё- 
тов или наземных бригад, могут существенно повысить шансы при борьбе с пожаром. Но для это- 
го нужно рассчитать количество ресурсов, что может занять довольно много времени. 

Одним из способов решения данной проблемы может быть использование нейронных се- 
тей. В представленной работе для обучения и тестирования модели нейронной сети авторы ис- 
пользовали данные о произошедших пожарах в парке Монтезиньо (Мошеятйо), расположенном в 
Португалии. Этот набор данных общедоступен для исследования и работы с ним [1]. Авторы ис- 
пользуют нейросетевую библиотеку Кегаб [2], написанную на языке программирования Руоп [3, 
4]. 

Подготовка данных. Данные возгорания парка Монтезиньо были выбраны в качестве обу- 
чающего материала для модели нейронной сети в связи с тем, что комплексный показатель по- 
жарной опасности В. Г. Нестерова, используемый в РФ, содержит меньше параметров, а это может 
быть причиной более низких результатов при обучении модели. В используемом авторами наборе 
параметров, кроме традиционных, содержатся параметры: влагосодержание лесной подстилки и 
почвы, характеристики пламени, антропогенный фактор и грозовая активность. Ниже приведены 
дополнительные параметры рейтинговой системы лесной пожарной опасности, которые использо- 
вались при формировании данного набора [5]: 

® вероятность возгорания (Ете Гие! Моляште Соае, ЕЕМС); 

® норма влажности угля (Ви} Моляште Соае, ОМС); 

® норма засухи (Отоие т Соае, ОС); 

® индекс первоначального распространения системы (им 5ртгеаа ТтаЕх, 151). 

Все метеорологические данные для расчёта упомянутых выше компонентов можно запро- 
сить у ближайшей метеорологической службы. Так как данный набор данных содержит довольно 
много климатических параметров, с помощью созданной и обученной модели можно будет пред- 
сказывать будущую площадь пожара не только для парка Монтезиньо, но и на любой другой схо- 
жей с ним территории. 

Полные данные, содержащиеся в наборе: 

® Х — пространственная координата оси Х на карте парка Монтезиньо: от [ до 9; 

е У — пространственная координата оси 7 на карте парка Монтезиньо: от 2 до 9; 

® «месяц» — месяц года: от января до декабря; 

® «день» — день недели: с понедельника по воскресенье 

е ЕМС — индекс легкости воспламенения топлива из системы РУ! в интервале значений 
18,7—96,2; 

е [МС — индекс нормы влажности угля из системы РУ! в интервале значений 1,1-—291,3; 

е [С — индекс нормы засухи от системы РИ/Гв интервале значений 77,9-860,6; 

е [5/ — индекс первоначального распространения из системы РУ! в интервале значений от 
нуля до 56,1; 

® «Температура» — температура в интервале значений 2,2—33,3°С; 

® относительная влажность от 15,0 до 100 %; 

® «Ветер» — скорость ветра от 0,4 до 9,4 км/ч; 

® дождь снаружи от 0,0 до 6,4 мм/м*: 

® «Площадь» — сожженная площадь леса от 0,00 до 1090,84 га. 

Все параметры в наборе изменяются в разных диапазонах. Для того, чтобы повысить точ- 
ность прогнозирования модели, нужно провести нормализацию данных. Один из способов норма- 
лизировать данные — это вычесть из каждого параметра его среднее значение и разделить на 
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стандартное отклонение. После этих действий среднее значение будет являться нулём, а дисперсия 


— единицей. В этом случае данные в каждом столбце будут изменяться от —1 до +1, но при таком 
способе нормализации в некоторых столбцах могут появиться отрицательные значения, что не 
может быть для некоторых параметров. Для решения этой проблемы можно использовать проце- 
дуру МтМахэсаек ). ПЕ 1тапзГоти() [6], которая преобразует все данные в диапазон 0... +1. Такая 
модель обучается с помощью «обучения с учителем». В этом случае данные делятся на две части 
— данные для обучения и верные ответы для этих данных. Данные для обучения необходимы для 
обучения модели, а ответы — для перерасчёта весов на рёбрах графа нейросети при несовпадении 
предсказанного значения и действительного. Перед обучением случайным образом разделим эти 
данные на обучающую выборку и выборку тестовую. Обучающая выборка является частью набора 
данных, используется для обучения модели. Она будет составлять около 90 % набора. Тестовая 
модель составляет 10 % набора данных и служит для проверки работоспособности модели. Тесто- 
вые данные не будут участвовать в обучении модели, они служат лишь для проверки работоспо- 
собности. В последующем такое моделирование можно связать с классическим построением мо- 
делей и расчетом показателей техносферной безопасности [7,8]. 

Создание модели. В процессе тестирования различных моделей для рассматриваемого 
набора данных лучше всего зарекомендовала себя модель, содержащая 6 слоёв: входной слой с 24 
нейронами, 4 скрытых слоя, содержащих 48, 96, 48, 24 слоя, и выходной нейрон. 

Использовались следующие функции активации: 

® линейная — на первом, втором и пятом слоях; 

® сигмоида — на втором и третьем слоях, она позволяет усиливать слабые сигналы, не 
насыщаясь сильными; 

® 5е[и — на выходном нейроне, повышает показатель сходимости нейронной сети. 

При компиляции модели в качестве оптимизатора типа градиентного спуска использова- 
лась «адааейа». Ааааейа обновляет меньшие веса, которые слишком часто обновляются, но, в 
отличии от Аааэта4, вместо полной суммы обновлений будет использоваться усреднённый по 
истории квадрат градиента. 

В качестве функции ошибки, которая будет использоваться оптимизатором в алгоритме 
обратного распространения ошибки, выбираем среднеквадратичную ошибку, в качестве метрики 
— «тае», среднюю абсолютную ошибку. 

Обучение. На 500-эпохе обучения средняя абсолютная ошибка равняется 4,6, значит мо- 
дель при предсказаниях будет ошибаться в целом на 4,6 гектара, что авторы считают удовле- 
творительным. Кривая изменения ошибки представлена на рис. 1. 
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Рис. 1. Кривая изменения абсолютной ошибки при обучении на данных с нормализацией 
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На рис. 2 изображен график изменения абсолютной ошибки при ненормализованных дан- 
ных, который доказывает, что нормализованные данные показывают себя лучше, чем исходные. 
10. 
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Рис. 2. Кривая изменения абсолютной ошибки при обучении на данных без нормализации 


Прогнозирование. На рис. 3 представлен график, иллюстрирующий результат работы 
нейронной сети. На графике оранжевая линия — действительная площадь горения, синяя линия — 
предсказанная площадь. Как видно на рисунке, динамика изменения кривых для каждой записи 
практически идентична, что показывает хорошую работу обученной модели при прогнозирова- 
нии. 
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Рис. 3. Прогнозирование с помощью обученной модели на данных с нормализацией 


На рис. 4 продемонстрирован график прогнозирования другой модели, которая обучалась с 
помощью ненормализованных данных. Очевидно, что первая модель более эффективна. 
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Рис. 4. Прогнозирование с помощью обученной модели на данных без нормализации 


Заключение. В данной работе создана и обучена модель искусственной нейронной сети на 
наборе данных, содержащих различные климатические параметры и будущую площадь пожара в 
гектарах. Эта площадь является выходным параметром, который авторы собираются прогнозиро- 
вать. Как правило, такой набор данных доступен для исследования и изучения. Перед обучением 
модели нейронной сети набор данных разделяли на две выборки: выборка для обучения, которая 
составляет около 90 % от набора, и выборка для тестирования обученной модели. В постановке 
задачи авторы выбирают и анализируют известные данные о произошедших пожарах в парке 
Монтезиньо (Мотезутйо), сравнивают модели, обученные на этих данных, с нормализацией и без 
нее. В качестве результата приведены два примера демонстрации графиков изменения абсолютной 
ошибки площадей пожара, прогнозируемых с помощью созданной и обученной модели. 
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